本文探讨了含义关系的语言和计算方面,这些关系可以在两个或更多复杂的语言表达式(短语,条款,句子,段落)之间保持。特别是,它着重于释义,文本构成,矛盾和语义相似性。在第一部分:“单词和短语级别的相似性”中,我研究了分布假设(DH),并探索了几种不同的方法,以量化单词和简短短语级别的语义相似性。在第二部分:“释义类型和释义识别”中,我着重于释义的含义关系以及自动释义识别(PI)的经验任务。在第三部分中:“释义,文本构成和语义相似性”,我在有关文本意义关系的研究中提出了一个新颖的方向,这是由关于释义,文本构成,矛盾和语义相似性进行的联合研究所产生的。
translated by 谷歌翻译
开发对手挑战NLP系统的方法是提高模型性能和解释性的有前途的途径。在这里,我们描述了团队在第一个动态对抗数据收集(DADC)的任务1中“长角牛”的方法,该研讨会要求团队手动欺骗一个模型,以挖掘出挖掘的问题回答任务。我们的团队首先结束,模型错误率为62%。我们主张采用系统的,语言知情的方法来制定对抗性问题,并描述了试点实验的结果以及我们的官方提交。
translated by 谷歌翻译
数据增强是自然语言处理(NLP)模型的鲁棒性评估的重要组成部分,以及增强他们培训的数据的多样性。在本文中,我们呈现NL-Cogmenter,这是一种新的参与式Python的自然语言增强框架,它支持创建两个转换(对数据的修改)和过滤器(根据特定功能的数据拆分)。我们描述了框架和初始的117个变换和23个过滤器,用于各种自然语言任务。我们通过使用其几个转换来分析流行自然语言模型的鲁棒性来证明NL-Upmenter的功效。基础架构,Datacards和稳健性分析结果在NL-Augmenter存储库上公开可用(\ url {https://github.com/gem-benchmark/nl-augmenter})。
translated by 谷歌翻译